人工智能在香港暴动中的应用
多年前,在我读硕士的时候,垂涎一位台湾女神老师的美色,跑去旁听她的课。正当我捧着两腮,眼冒星星地看着女神,花痴地流着口水时,听到她说:人工智能是不可能取代人的。当时她正在展示两条新闻,都是关于某位大人物的去世。一条由人工智能机器人编写,内容是某年某月,谁谁谁死了,头衔是什么,过往生平如何。另一条是记者写的,内容类似于“天阴沉沉地下着小雨,仿佛全世界都在垂泪哀悼……”当女神老师斩钉截铁地表示,应该抛弃人工智能的作品而选择人类的作品的时候,我意识到女神老师和前沿领域脱节了。
今天在香港暴动中,人工智能有着极其广泛的大规模的应用。
人工智能的最简单最容易实现的应用是对话机器人。随处可见的机器人客服就是一种形式,在互联网公司、电商公司、游戏公司早已有非常普遍,在其它企事业公司单位也逐步应用中, 还有,也包括苹果的Siri,亚马逊的Alexa等等。
在香港暴动的组织过程中,这些对话机器人就被大规模的部署。有在聊天软件中担任活动登记、活动协调的,有负责管理申领暴徒餐券、申领装备的,有在社交平台上负责管理新闻列表的,有负责收集和分发信息的,数不胜数。如果你对对话机器人熟悉的话,你还会发现这些机器人也有多个不同的版本,有些开发得较精良,有些则比较粗糙,连机器人的名字、链接所具备的一些特征,都没有隐藏起来。
对话机器人的应用对组织工作带来极大的好处。一是极大地提高了组织效率。原来一个上线大约管理10-20个下线,就会比较头疼,会错乱百出。使用了对话机器人之后,可协调的人数也就大大增加了。二是使得暴徒的组织得以扁平化,便于分工,大大减少了中层的组织人手。三是在背后组织者和前线炮灰之间建立了防火墙。暴徒们是尽量避免组织者和赞助人、也称“家长”,和前线炮灰、也称“仔女”,建立直接的联系。这也是他们对抗警察侦察的手段。
第二个应用的地方,在于暴徒们使用的多个APP之中。这些APP都不是商业软件,而是自行开发的。这些APP包括暴徒培训手册“香城Online”,被内地官媒点名批评的提供实时地图的HKMap.live,香城GO,在游戏平台“Steam”推出的“光复香港”游戏等等。
这些APP一方面使用大数据技术来管理情报,例如香港警方的车辆信息、装备的流动信息。他们一方面整合全职哨兵提供的信息,以及众包的兼职part time的学生哨兵提供的消息,另一方面通过正负评价的大数据来筛选、淘汰兼职哨兵。这和互联网公司的PGC(专业人士生产内容)和UGC(普通用户生产内容)并重的运营模式是类似的。
这几个APP既有苹果iOS端,也有安卓端,开发和运维的工作量不小。后台也用到了实时地图、大数据管理、云计算服务器等技术。我估计,这几个APP如果是在同一家公司里并行开发,开发加测试加运维,大约需要50个全职员工加50个外包员工来完成,这大约是一个中型互联网公司技术部的规模了。
有人爆料说暴徒培训手册“香城Online”的开发者叫“梁定柏”,1986年7月16日出生,毕业香港理工大学电子与信息工程专业,职业是软件工程师。他可能是暴露的第一个人,不会只有他一个人。
暴徒们用的地图是美国ESRI公司(环境系统研究所公司Environmental Systems Research Institute, Inc)提供的。而ESRI是美国联邦政府的四大软件供应商之一,其它三家是微软、Oracle和IBM。所以,开发团队要么支付了昂贵的费用来购买地图数据,要么就是通过特殊的渠道拿到了授权。
他们买的云服务器应该是亚马逊的AWS。
人工智能在香港暴动中的第三种应用是吵架引导。
此模式是首先通过搜集过往针对某一主题的海量吵架对话文本,识别出哪些对话容易引起吵架,并给予评分。然后综合评分高的内容,自动生成吵架文本。在需要的时候,由人工触发或机器人自动触发,发送吵架文本,引发网络吵架。
我举2个例子。
第一个例子,10月5日,美国NBA球队莫雷发布支持香港暴乱的言论。然后在微博上,有人自称是饭圈女孩,指责爱看NBA的虎扑步行街男生不爱国,还有人自称虎扑用户,指责饭圈女孩昨日如何今日如何。这些人带节奏的话语有点特别,我就记住了。正好,我身边既有好几位饭圈女孩,也有好几位虎扑男生,连忙去求证你们有这样的想法和指责吗?得到的回复都是没有,他们双方都很支持对方。那是谁要带节奏去挑起两大战斗力超强的群体的内讧呢?
这个例子我一直在怀疑,第二个例子给了我启示。
第二个例子,几天之后,我开始在多个微博上发现有聊天机器人发出的吵架引导文本。
通常你会在情感贴下面才会吵婚恋观,在鸡汤贴下面放地域炮,在美食贴下面吵豆花是甜的还是咸的。
但是,如果在一个美食贴下面,有人离题发贴带节奏要吵婚恋观,在宠物贴下面,发贴带节奏要吵人是不是亲生的,生男好生女好,那么就比较奇怪了。
这些就是程序异常的典型特征了。
因为聊天机器人的开发一般不那么完善,所用到的人工智能的语义分析技术并不能让程序完全理解对话内容,程序常常并不知道别人对话的真正意思,但是能知道什么对话和什么对话相关联。于是,当吵架引导是通过关键字来触发的,那么非常容易在错误的语境下触发。
在这第二个例子中,机器人并没有理解他人的对话内容,而是由于原帖中的个别关键字触发了吵架引导程序。那么,可以非常确定是机器人在带节奏。
回到NBA的问题上,有人带节奏是肯定的。我没有派蜘蛛去爬那几天的微博吵架文本,还不能确定是机器人带的节奏要吵架还是有人要带节奏要吵架。
最新的发展是在微博上的香港警察越来越被动,一方面在香港被田二五找麻烦,一方面,有多个可疑ID在香港警察的微博上越来越频繁地挑动内地网民和香港警察对立,分化香港警察和内地网民的关系。当你再看到这些带节奏吵架的,你要先想想是不是机器人了。
这些是要在内地网络上开战的信号,战争要从香港蔓延到内地了。
我们中国14亿人,意见和想法多种多样,不会完全一致,绝对是吵架机器人收割的绝佳战场。只要引起各个群体之间的骂战,挑动争执和仇恨,大家还会有安宁的日子过吗?
所以,如果我们想为社会多做些贡献的话,那就是绝对不在网上吵架。
人工智能的第四种应用是社交媒体上的信息推荐。通过对用户的特征进行搜集和归类,然后定向推送有偏见的信息和假消息。操控美国大选选情的数据分析公司剑桥分析公司是通过脸书平台去做的。本次香港暴动和区议会选举中,暴徒与脸书、连登论坛、聊天软件是深度绑定。要再来一次,通过向特定人群推送假新闻、影响选情,是轻而易举的。这个说得太多了,略。
第五种应用是人脸识别和视频识别。暴徒们声称他们是靠人肉来起底的,实际上不止。对蓝丝的起底速度相当快速。10月6日,香港那位被打得半死的59岁出租车司机,在2小时内被暴徒找出来其曾经参与过出租车国庆游行。而那段原始素材是一段影片。那么,也就是说,暴徒们具备了视频识别的能力,通过出租车的车牌号来在海量的原始视频素材中搜索到结果。这也包括直播中的情报识别。通过综合各家的直播信号以及众多普通人上传的视频直播素材,拥有海量的素材后,就能应用人工智能技术去识别情报。
第六种应用是建立蓝丝数据库。在香港警队里当然有内鬼。一个合格的内鬼,是不会每次需要查数据的时候才去查询数据,更合理的方法是把警队名录等资料导出来,在外部建立独立的数据库。有暴徒非常嚣张地表示,目前他们手上掌握的警员的数据已经相当完整,想查什么都能查到。那就是数据库已经建好了,照片、姓名、警员编号、家庭住址、家庭成员全部齐全了。另外,香港每家学校都有教育局规定要安装的一套学生信息管理系统,里面包含学生家长的姓名、职业、家庭住址、联系方式等信息。每个学校有一个系统管理员,有系统权限,能够把数据全部导出来。只要这个系统管理员是黄丝,做这件事情轻而易举。暴徒们已经在积极找人偷出数据。这些泄露的数据越多,社会上的蓝丝将无可遁形。
第七种应用是区块链。有暴徒表示他已经把警员名册上传到区块链。我还没找到是上传到哪条链。由于区块链是无法修改的,无论哪条链,只要写入,那么相当于3万香港警察的个人信息将能被世界上所有人永远下载。
好了,暴徒的恶行简直就是馨竹难书,形势也是越来越紧张。
人工智能的应用是越来越广泛。其进化速度是相当快的。目前还有一些特征和错误可以帮助我们识别出来,过半年一年,目前的识别方法就会过时了。因为人工智能应用是采集了我们过去的数据,通过整合、分析后,再进行输出,所以会非常类似昨天的我们自己。这给我们识别带来了特别的难度。
等等,那位急着跑出去要找人工智能厂商谈合作的兄台,你回来,你知道你准备去找的那家人工智能厂商,有没有双面人在当高管吗?
我知道有。